《加密艺术与元宇宙》系列讲座第十一期,我们邀请到杭州心识宇宙有限公司研究院院长,集智俱乐部核心作者,科学作家十三维作为主讲嘉宾,以“演化艺术:生成、智能化与多主体涌现 ”为题做主题分享,并邀请了中国社科院哲学所科技哲学研究室主任、研究员、博导段伟文,媒体艺术家、研究员吴子薇作为讨论嘉宾,独立纪录片导演、艺术家、当代艺术摄影批评人袁园担任主持与三位嘉宾展开对话与讨论。
本文为讲座内容文稿,扫描下图观看视频回放。
谢谢袁园老师、服务器艺术地邀请。我今天分享的题目是“演化艺术”生成、智能化与多主体涌现”。我这几年从复杂系统视角看待艺术现象,发现复杂系统和演化在艺术发展史上是一条还没有被人特别注意,而其实又是很深刻地影响艺术发展的主线。所以,我今天提炼出来和大家分享这一主题以及由其衍生的一些主题,一直到加密艺术。
1.创造系统与艺术的起源;
2.演化艺术与遗传算法;
3.复杂性、适应度、环境与认知;
4.创造系统层级与多主体涌现;
5.复杂主义、加密艺术与艺术的未来。
什么是艺术?我们通常认为艺术是由一个艺术家利用某个工具在某种媒介上进行的创作。这个创作通常是独立于自然的,是艺术家本人创作的一个作品。但这并不意味着这是艺术的本质特征。为理解这点,我们可以考察艺术创造的起源,先用一个最古老和最现代的视角进行对比:
左图是二百多万年前的南非马卡潘斯盖(Makapansgat)地区出现的人脸形卵石(Pebble)。但在那个时候,解刨学意义上的智人还没有出现,得等到20万年前左右,因此更没有晚期智人大脑的认知革命,没有符号能力、没有想象和虚构、以及大规模协作能力。那么很多人就问这个东西到底是不是艺术?右图是现在最火的文生图大规模预训练模型Dall-E2的产物。其提示词(Promot)是告诉它画出一个宇航员在太空上骑一匹马,它就创造出了这么一幅画。这两者有什么区别和相同点?除去内容,区别是它们的媒介不同,相同点是它们都并不是艺术家本人的创作。Pebble很可能是天然的产物,因为那时作为人类祖先的南方古猿还没有想象力和创造力,之所以能保留下来,很可能就是因为作为天然形成了一个人脸,南方古猿、智人以及现在我们看到之后都觉得很像。这是个简单的猜测,但总之它就是这么偶然被生成和创造出了,形成了一个至少现在被认为可能是艺术品的东西;右边的Dall-E2产生的AI艺术也是类似的道理,包括最典型的被收藏的AI艺术作品《太空歌剧院》。它们的创作者只是写了提示词,都没有直接去参与到创造过程中。也就是说,最古老和最现代时代都存在这样的作品,它们并不是人类艺术家基于自己意识的直接创作。文艺复兴时期的达芬奇曾经也创造了一系列非常有趣的艺术,不是用自己的画笔去画的,而是利用很多外部系统,像湍模拟大脑,利用它们产生的纹理作出一个作品。
按照现在对生成艺术的理解,达芬奇就是在进行生成艺术的创作。Pebble和DallE-2不是艺术家本人创作,达芬奇是自己进行创作,但是他没有亲自完成全部过程,而是利用外部系统进行创作。
如果说普通艺术是用某种工具在一种固定媒介上进行创作,生成艺术则是利用一个外部创造系统进行创作,只不过艺术家会进行各种干预,这个时候艺术家就不是一个单纯创作者,而更多作为一个选择者了。
纽约大学教授菲利普·加兰特(Philip Galanter)指出,生成艺术是指艺术家利用某种系统,如一套自然语言规则、一个计算机程序、一台机器或其它程序性编造方式进行的艺术实践。这些系统的运行具有一定程度的自主性(autonomy),进而促成一件完整的艺术作品的生成。
简单来说,工具是没有任何自主性的,而利用外部系统进行创作,系统自身会产生很多东西,提供一些艺术家本人没有预先想到的信息。这些加在艺术创造过程中,最后完整的作品就是你和系统的共同创作。
因此艺术概念发展到生成艺术阶段,会有几个改变。首先,从方法上是从工具到系统地改变;其次是从被动到自主性,由于系统的生成能力——即去创作者中心化,因此艺术家本人会越来越不重要,只是其中一份子;从可控到失控,这一点非常有趣,失控的结果却是连接到更大的系统,可以进行更大范围、更大规模的连接和创作;还有最后艺术在呈现过程上是从外部的模仿或表现变成意料之外的生成和共现,这样的最终结果是艺术品的复杂度越来越高。提到生成艺术,最近神经网络预训练模型产生的文本生成图像太火了。
大规模预训练模型的本质是什么?是用互联网的海量数据进行深度网络训练,如图像、声音、语义数据等,彼此之间如图像和文本有连接和对应,经过诸如 Transformer 模型训练后,再经过一些生成算法、分析句子的概率分布,找出对应的图形概率分布,最后画出一幅画。
深度神经网络是基于模拟人脑神经元的原理,通过多层人工神经网络训练而成,依赖于大量的数据和算力,才具有强大生成能力。现在比较火的是DALL.E2、Midijourney、Stable Diffusion,它们都是基于种种生成模型来做的,其中各种生成算法可能不同,比如以前的GAN或现在流行的Diffusion模型,但总之这一类都是基于深度神经网络启发的生成模型。
神经网络是基于神经启发的一类算法。虽然它能模拟任何算法,但如果从整个算法分类来看,最基础的算法还是基于规则进行生成的。下面是基于规则生成的几张图:
上排左1:元胞自动机生成的图片,元胞自动机是图灵完备的,可以模拟任何计算系统;
上排左2:混沌方法生成的三翼鹰;
下排左图:基于迭代方程规则生成的效果,是很多分形艺术;
下排右图:图灵的反应-扩散系统(Reaction-diffusion)可以生成很多纹样,最开始都是确定的方程,但多次迭代之后产生非常复杂、有趣、迷人的生物斑图样式。
利用概率分布、随机游走或者捕捉自然界的很多随机现象,也能发现新模式或利用其创造。
左:在音乐作曲中,利用随机方法生成偶然音乐、噪音音乐;
右:Quantum cloud 是艺术家Antony Gormley1999年创作的作品,是通过随机游走生成的,艺术家最终把它做了出来的。在随机的过程中,艺术家更重要的是作为选择者,他会决定哪个模式可以保留下来。
这张图高度概括了艺术生成系统的分布。左边是基于秩序的规则生成,从对称性、破缺开始,或者分形、L系统开始;右边则是从随机、概率、或混沌系统开始生成。一般而言,传统使用固定媒介和工具的艺术方法也都是分布在两边尤其在左边。
如果从有效复杂度,即计算作品信息熵来看,两边复杂度会比较低,最高复杂度的艺术是以创造系统,通过演化艺术、演化方法进行创作的人工生命艺术,最后形成的结果是复杂度最高的,即中间的高峰。演化艺术最核心的是演化算法,然后有基于规则、基于随机,以及基于各种自然启发的算法,比如蚁群、蜂群基于群体规则、群体之间的互动,就是一类启发算法、集群启发算法。
自然中存在着无限多种算法,可以这样理解,我们拿到之后可以利用这些算法进行创作。如果从生成和演化的创造讲,它就是代替了色彩、笔刷等绘画的基本元素和操作,那些物质介入的方式,而变为了以在时间上进行操作的算法的抽象变换。这些就是演化艺术的典型特征。例如艺术家米格尔·舍瓦利耶的植物标本作品就是通过演化计算生成的。先设置一些简单的植株,设定一些规则,再设定一个选择函数,计算适应度,最后演化出可能是现实中没有见到的植物,但和真实世界植物具有一定的相似度,这就是一种从无到有的高复杂度的创作。生成艺术和演化艺术的概念可以看成是一种对偶关系,某种意义上是等价的。任何创造都是广义的生成。例如如果把神经网络、预训练大模型也当做生成,那其实是一个提示词命令的结果、非常简单的生成,复杂度不是很高。
而演化艺术是连续的,在时间上能够不断地进行生成跟变化,整个创造系统,是基于算法的动态过程。下面我们可以将这几个概念进行下厘清,它们之间是向下包含的关系:生成艺术:纯粹使用代码语言、算法或某个创造系统进行作品创作;
演化艺术:基于演化等算法,创作者通过使用各种媒介创造了一个能自行演化的创造系统及后续造物;
人工生命(A-Life Art):创作者通过创造一个创造系统创造了类生物或类人智能主体;
智能体艺术:如机器人艺术,创造者通过一个创造系统创造一组能创造艺术的智能体集群、社会或生态;
对比自然系统(左边是晶体和矿物,右边是大气和气体,中间是生物和生命)和创造系统,显然演化艺术本身高度近似于自然的演化过程,因此可以看做是人类艺术形式向大自然的又一次回归。艺术发展到现代艺术、后现代,表面上看越来越脱离写实和模仿,但如果从生成艺术演化视角来看,会发现人类用的方法又回到自然了,因为自然生命最根本的核心算法就是遗传算法,我们现在运用遗传算法就能创作出更高复杂度的作品。如果大家对自然选择比较熟悉,理解遗传算法就比较简单,它可以用计算机模拟,可以说是一种全局的优化算法。其他算法往往只能对局部某些问题找到最优解,但遗传算法对多目标或者是没有明显目标的过程,往往能有效地达到一个比较优的解,或者不需要一个比较优的解,只要能适应环境就一直存在下去。
遗传算法的流程,首先要有一个初始的种群,其次种群之间遗传、交配交叉和个体的变异,最后有一个方程,对自然选择的适用度进行评估,如果适应就会被选择,不适应就被淘汰。遗传算法最基本的概念是理解基因型、表型和适应度函数这三个概念。
基因型:基因组定义遗传特征的编码,如ATGC碱基对,或计算机程序代码都算是基因型。
表型:在特定的环境,无论自然环境、虚拟环境还是程序编辑环境中,呈现的结果都是表型。
适应度函数:各个个体对环境的适应程度叫做适应程度的函数。对数字艺术而言,基因型由一些数字编码、机器编码的参数构成,在环境中表现出某种表型,之后通过适应度函数进行评估,如果适应就存在。如上图所示,我们会发现《蒙娜丽莎》越来越像《蒙娜丽莎》,就是因为适应度函数是以她为标准的。1. 遗传算法:选择
选择操作从旧群体中以一定概率选择优良个体组成新的种群,以繁殖得到下一代个体。个体被选中的概率跟适应度值有关,个体适应度值越高,被选中的概率越大。2. 遗传算法:交叉
交叉算子,是指从种群中随机选择两个个体,通过两个染色体的交换组合,把父串的优秀特征遗传给子串,从而产生新的优秀个体。它其实会分好几种交叉或者是遗传方法,如单点交叉、多点交叉、均匀交叉、算数交叉。交叉算子是通过个体层次之间的交互产生算子的。
3. 遗传算法:变异
变异算子在纯粹的个体层级发生,比如个体突然基因变异,就是编码受到某种扰动,像科幻中被一个粒子击中基因就变异了,后代会受其影响。个体层级的变异能够随机扰动,产生某些新的不同于原有种群的性状跟物种,驱使整个种群进化。可以看到,选择、交叉、变异三种遗传算法算子发生在三个不同的系统层级之间:选择在种群与环境层级之间;交叉在种群之间;变异在个体层级之间。这个特点使得演化算法与强化学习等算法有所不同。演化本身是跨复杂多系统层级的过程,演化艺术也是做这个事情,但最终决定的是适应度函数,因为生物体或者虚拟造物最终是需要在一个具体环境中生存并获取能量资源的。
在演化艺术中有一个NevAr(Neuro Evolutionary Art,神经演化艺术)系统,起初随机生成的几张图可以认为是初始种群,适应度函数里面有两个O,参数O1是内部图像集合特征,O2是外部集合特征,因此适应函数那么O这个参数怎么来的?它来自创造的另外一个系统AAC。上图左是一个通过遗传算法创造种群的引擎。AAC相当于人工艺术批评家,其实是一个人工神经网络,对已经生成图片的特征进行提取,这是前面的O1。O2则可能是偏离了它,但还在接受范围内的样本特征,这样经过一定数据训练形成神经网络AAC得出O1和O2,再对创作引擎生成的种群进行评判选择。这个工作应该是2000年左右产生的。
而我们熟知的对抗生成网络GAN,和NevAr有非常类似的结构,是2014年提出的。可见在演化算法中利用对抗生成网络比现在的大规模预训练模型早很多。后者的还是要通过大量的数据获得某个样本在潜在空间的分布,对所有猫的数据训练后就能画出一张一张非常像猫的图片。我认为适应度函数是演化艺术的核心概念,其次是环境,而适应度本身就是一个审美的过程。1928年,数学家 George Birhoff 提出了一个公式:审美度量M = O/C(秩序/复杂度)。
O包括物理学和数学经常说的的各种对称性;C是复杂性科学研究的核心概念,包括各种复杂度,不同系统有不同的复杂度,会进行各种加权,根据不同的情况进行选取,最终得出M=O/C。
审美度量本身符合很多理论研究,比如心流理论,就像我做一件事情时,如果我觉得很难,就会厌烦、恐惧,如果很熟练很简单也会觉得无聊,只有在我的技能水平和挑战难度在一个恰当比值时才会进入心流状态,那个时候的我是最愉悦的。
从演化心理学看,对应的则是审美愉悦加工流畅度理论,即让我们感到美的事物或环境一定是我在加工的时候最舒畅的,而非感到很单调或者很恐慌;此外还有一个关于最优学习率的研究,就是我们在学习一个事情的时候,如果陌生的内容占比15.87%,即熟悉的大概85%,那时学习效率最高,感觉也最爽。这就是适应度函数和审美度量的一个关联,让整个系统运作最高,也就是在自然选择的“审美”来看,是所谓“美者生存”。复杂性有很多,比较直观度量方式是是分形复杂度,假设一张白纸的维度D为1,完全涂黑为2,那么人类的眼睛更偏好于看维度D=1.3,也就是蓝天白云,因为人观看D=1.3的分形图案加工很快,所以就会获得愉悦的情绪反应。
用这个分形复杂来算波洛克的某些抽象绘画,分形维度能达到1.9,这就超过正常人的审美舒适区了。现代艺术不追求审美和愉悦,那么这种破坏性、新奇性就成了突破审美的一种方向、一种革新。复杂度本身不一定客观,最简单的复杂度是熵复杂度,只要计算信息量就可以。
但信息量越大就越美吗?不是的。上图中d的熵复杂度信息量最大,但a是最美的,因为我们赏画的时候,人脑会把噪声去掉,进行一种粗粒化。这种复杂性就称之为结构复杂性(structural complexity),这个指标是经过人脑粗粒化处理后的产物,代表正常人类忽略了很多杂音后的标准审美。结合前面的审美度量M=O/C,其中复杂性C会用结构复杂性,而不是纯粹熵复杂度。复杂度是很多的,有客观的也有主观的,也有不同系统的复杂度,必须根据情况进行选取。图片右上是一个基本物理学的研究,物理学都可以归为对称性/守恒性的研究,都是自然界基本粒子和作用力在数学对称性的关系,这是几乎绝对客观的,不以人的意志为转移的Order。
图片右下总结了很多复杂性,这些复杂性是因为时间和规模,比较成熟和复杂的系统,有些比较技术指标能够作为我们对适应度函数进行设计或者是作为某种参数和因子。
左图:审美度量 M=O/C,这个图像我在朋友圈问大家哪个最美?最后选择的是中间最美,而它的计算结果就是M=13/12≈1.08,而左右两个的M都等于1。在这个思路下,我们可以认为美不仅仅是纯粹主观的事情,自然本身存在着美的过程。
对称性代表着 Order(秩序),是能够提高物种生存概率的,晶体就非常稳定,对称性很高;水熊虫的存活率很高,虽然没有算过,但是它的某种对称性应该也是很高的。
而复杂性类似大脑功能,或复杂活系统系统,通过神经启发研究深度网络进行模拟,大脑复杂性很高,是提升适应度和环境变化应对程度的。例如有一种海洋动物叫海鞘,幼虫有大脑,环境比较复杂,当它到了水草丰美的地方把脑袋吃掉了,因为吃浮游生物就能吃饱,就不需要大脑了,降低能量消耗的成本。
我讲上面这些内容,主要是想说科学和艺术本质上还是统一的。最小作用量原理/物理方程可以认为是一个终极的适应度,所有系统发现会遵循这个原理,包括生命系统。审美度量的研究也充分体现了“美者生存”的理念。
a 基因型、表型、选择者都是独立的,基因编码是设定的,适应度函数也是设定好的,包括表型在那没有环境关系。一般通过分形、元胞自动机等方式生成的算法就是这类结果。b 表型嵌入环境、基因型和选择者是独立的。基因型跟表型、选择者不会相互影响(例如表型不会作为新样本影响基因型),但表型会因为环境存在有不同的呈现。这还是一种设计的结果,如预训练模型相同Promot会出现不同但相似的表型。
c 环境作为隐藏的选择者,基因型独立。这一系统,可以认为开始设定了某些基因编码,比如上帝设计了agtc,但之后就跟他没有关系。表型在环境中自己跟环境相互作用,有自己各种物态的演化、环境的偶合、选择,最后存活。
d 如果没有上帝,基因型、表型、以及产生表型的所有机制,包括选择函数本身都将是在自然系统中产生的,只是说分基因型和表型两个层级,整个系统再跟环境系统进行作用,作为一个生命不断提高自己的适应度生存下去。
适应度和环境的关系很大,在认知科学中有所谓4E认知(具身、延展、嵌入、生成),如果第四种的基因型、表型、选择者都和环境嵌入,那么脑、身、视觉和感官之间就会有种种交互,交互就有相应沟通的信道,或者遵循某些物理、生物、化学的协议进行互动。如果设计一个纯粹的虚拟世界,肯定要考虑几个系统之间交互的不同,以及有哪些特别的属性和特征,再设计到适应度函数中去。通过遗传算法电子羊的例子,是对菲利普·迪克《仿生人会梦见电子羊吗?》的致敬。
左边是一个客户端,下面是用到的算法和纹理样式,服务器开始设定好参数,然后让用户选择哪个最像羊,选择就会存活,不选择就会死掉,最后表现的越来越跟以往的生成算法不同,变得越来越复杂,有更多呈现的样式,这就是引入了作为用户选择者的互动。演化艺术不仅能够形成所谓的物态、物种,集群模式也是能够生成的。
比如用植物学L系统,怎么生成一种集群模式?L系统是很简单的迭代系统,开始也是涉及到某些初始值、初始字符串,以及一个简单的规则。
最简单是A变成AB,B变成A,N等于0的时候是A,N等于1的时候是AB,继续往下推就变得越来越复杂。
右边的集群模式也是的,a是简单的线性阵列,可以认为是一个鸟群,直线飞;b是环形阵列,鸟群可能飞到足够长的时候,就变成一个环。总结一下规则,通过接触方式,一个连一个的时候,如果时间足够长,前鸟接到了后鸟,就能够变成一个环;如果环足够松散,又还原成a。遵循简单规则,就会发现集群模式最后会演化成比较复杂有趣的模式,比如c变成类似8字环;e和f也都是,是从L系统很简单的规则演化出来的,这是一种模式的演化。这是一个人工蚁群的例子,模拟蚂蚁走路的过程,设计了很多人工信息素,如果蚂蚁嗅到信息素会追逐它。
蚂蚁的行动规则非常简单,有三种概率:正常的时候直走,根据信息素不同的角度,斜着走(a)或者直接向左右拐(b),三种概率加起来为1。利用简单的规则,虚拟的蚂蚁会生成越来越复杂的画面,这就是一种通过集群协作演化和遗传算法二者结合的创作。
用户觉得哪幅画最美,哪幅就是最有价值的,最后的选择者适应度还是由用户或者观察主体决定的。
艺术家米歇尔·佩桑创作了一个系统,这个创作系统本身又创作出很多不能被预先设定的作品,比如《非物质书法:花束》,这是演化艺术的另外一种模式——创作一个主体进行创作。
关于创造系统,2022年一篇研究报告把创造系统分为5个层级,以及机器艺术家和图灵艺术家两个阶段:
一,生成系统(G-mnerative system);
二,鉴赏系统(Appreciative system);
三,艺术系统(Artistic system);
四,共生系统(Symbiotic system);
五,真实系统(Authentic system)。
生成系统:一个系统需要某些输入来产生不同的输出,可以改变系统参数以改变生成的输出。
鉴赏系统:一个能够辨别输出质量的生成系统,允许通过与审美价值(如新颖性和惊喜)相关的测量矩阵,将审美偏好编码为一个效用(适应度函数)。这里就会用到前面所说审美度量的很多指标。艺术系统、共生系统和真实系统就是所谓的“图灵艺术家”,跟图灵测试很像,当一个创造系统创造出来的艺术品,分不清是机器创造还是艺术家创作的时候,通过图灵艺术测试,我们就认为它是一个图灵艺术家,它也分三种:
艺术系统:一个欣赏系统,可以发明自己的审美适应度函数,并使用它们来过滤和排列它所产生的输出。因此,这个艺术系统可以艺术式地影响世界,即能够对物理世界产生因果作用。
共生系统:一个能与人类就审美生成进行交流的艺术系统,从而通过解释和高质量、令人惊讶的输出影响人类对艺术作品的欣赏(机器对人的影响)。此外该系统可以从人类和环境中学习,产生重要的、有趣的、不可预测的输出(人对机器的启发)。
真实系统:一个共生系统,可以通过检测人类反应的传感器、改进的现场和在线人机互动等技术,记录人类/机器在创作方面的互动,记住自身创作和人类审美的生活经验。该系统可以将生活经验和外部知识转化为观念,反映在生成处理和输出中。
下面是两个例子:
人工生命的狗也能检测人的感官、动作,进而做出反应;
《数字生态系统》创造了一些主体,比如浮游生物以及某些类似鱼类被基因吞食、捕食,最后让数字生态自己运行。
这类数字生命或人工生命最终的目标是能够创造出具有智能的生命系统,类似纯粹的数字虚拟人,能够跟人交流和互动的强AI,有自己的情感、偏好,这也是所有人工智能研究者梦想的圣杯,可以称之为AGI、强人工智能或human-level AI等等。
我们公司是做虚拟人的和强人工智能的,我们也做了一些探索,通过模拟人脑方式让虚拟人有了自主的交互能力。例如这个虚拟人有了自己的记忆,跟你交流的经历都会记住,在日后交流中会以主动的方式和你进行当前话题的一些交流,也有画画的能力,这些事通过生成模型做出来的。演化算法可以利用各种算法,但有很多算法没有被创作者们利用上,尤其是艺术创作中,只是简单地用蚁群或者是以演化算法为基础,以及神经的一些启发,其他算法还有待挖掘,希望艺术家们去尝试,看能做出什么样的效果。比如粒子群算法就能做出很炫酷的效果,应该也有很多艺术家在用了。
1.对称性破缺——空间上的作用;
2.自组织——时间上的形成;
3.涌现——尺度/规模,很依赖于人的观察尺度。比如鸟群,单看是一只鸟,看整体模式、规模则变化万千。
这三种是相互交织的,但最复杂系统的诞生是从混沌到涌现,即over scale产生的,涌现是产生了一个新的、任何一个元素都不具有的属性或者是系统,是非还原性的,不能完全还原到以前的机制。涌现最简单的分类方式是分为强涌现和弱涌现,生命、语言、意识都是强涌现,晶体、湍流、鸟群是若涌现。
涌现更详细的分类方式是分为四类:简单涌现、弱涌现、多重涌现、强涌现,随着涌现强度越来越高,系统层级、系统要素之间交互作用、反馈方向越来越复杂。强涌现可以认为是一种集群之间、有着一种上下向因果都兼具的反馈过程,就像人类个体和人类整体之间的反馈,所以人类的语言跟文化属于强涌现过程,包括人类意识产生,很大程度上是文化属性的一个反应。
经过前面的讲述,我们已经知道,演化造就复杂性,而生成艺术的发展正是通过演化算法和各种复杂系统交互不断创造新艺术形式的。下面我们就来看看在复杂视角下,加密艺术的发展和艺术的未来。加密与复杂系统
在某种意义上说,只有“加密”后才能产生复杂系统,因为它意味着对某种私有信息的封装,这样才能横跨多个系统,而如果两个系统混在一起,是没法产生更长程的相互作用的。
自然世界中有很多加密、密码与密钥,DNA编码、文字可以认为是类似编码层面的系统,表型是生命本身、文化本身,都是密钥编码产生的,编码层是有很多加密的,会有很多加密的属性,包括去中心化、开放环境,通过自组织、自创生的方式;智能合约就是DNA碱基配对、以及到蛋白质中心法则的过程。
加密世界某种意义上也是重现了一个自然过程,只是以数字化的方式,包括变量快慢分离(如以太坊的共识层和执行层)也是这样的,它为群体智能、新组织层级的涌现创造了条件。
最底层个体 Agent Level 和 System Level行为的互动,为什么说加密可以做到这一点呢?因为通过Token机制将每个个体,比如一个人、一个钱包ID,甚至一个合约、一个物品、一个NFT都可以定位,然后就可以进行价值交换、流转,进行各种基于合约的互动,这是加密艺术的基础。
因此加密艺术的核心绝不是上传几张图片做成NFT去卖。著名的加密艺术加家PAK的作品The merge 很有趣,有很多个球,每个球都代表购买了一个NFT,你购买的越多球越大,变成大球吃小球的过程。
PAK就是通过合约系统调动交易者之间产生互动,最后变成了艺术作品,卖了9000多万,这绝对是物有所值或者符合价值的作品,因为它是对加密艺术本身一样的彰显。
智能合约的本质就是通过数字信号传输的某种协议。回到前面讲的,它实际就是适应度函数(FITNESS)的载体,所有的价值和判别都是通过合约完成的,所有参与交互的主体共同参与了选择和决策。
Terra0这件作品也很有趣,通过智能合约控制一片森林,自动贩卖自己多余木材的砍伐权以不断赎回自己,最终让森林自己拥有自己的产权。由于森林没有积累财富的需求,它会在完全拥有自己后将产出的资金投入人类的公共事业
它的Fitness可以认为是森林的存量、币值,是产生资金价值的变化。
The Space是2022年的一件作品,模式是相对传统的,但用了加密的形式,交易主体是有自己钱包ID的,NFT的像素也是唯一确定的。参与者艺术家根据自己的审美、自己认为的经济价值,以及一些注意力价值,希望人能看到某些图像,这些是这件作品的Fitness,最终形成了激进市场更高复杂度的一种共创的作品。
The Fingerprints Collection
Mutant Garden Seeder这件作品,每笔交易的确定性哈希值被用作随机函数的种子,最后生成非常有趣、复杂多样的艺术作品。
它的价值还在于稀有度,一般的NFT可以改参数,图像可能是变化的,纯链上生成的就类似自然界中产生的矿石,数字原生的艺术不是通过外部影响,纯链上生成的稀有度是更高的,当然其Fitness体现了审美等价值,最后体现在价格上。现在我们回到前面看,加密艺术中这种集体行为改变了环境,环境又影响集体行为的模式正是演化艺术的特征,其中进化系统的环境与选择者关系相当于第三型(c)。这也称为媒介/环境激发群体智能,如黄蜂通过媒介激发工作建造巢穴过程。而加密世界是一个开放的环境,不是封闭环境,可以容纳无限度的复杂性,预言机是把现实数据输到链上,更让链上能输入现实的无限复杂的信息。
因此加密世界的演化可能性可以认为是等价于现实世界,无论是链上艺术,还是元宇宙的建筑,它的互动会形成类似元宇宙的,能够覆盖物理世界的一个大的融合共生世界。
生命游戏是元胞自动机组成的,元胞自动机是图灵完备的,是可以模拟各种系统的,有趣的是,不同规则影响最后的表现。这里引入序参量(order parameter)的概念,可以通过某种规则或者是计算形成一个参数,参数影响它的模式,不同的值最后形成的元胞自动机的模式不一样。
从固定点—周期——复杂——混沌,在复杂和混沌之间,即所谓混沌边缘的状态,艺术创作中,调节这区域的序参量往往能够形成一个最复杂结构出来,也就是最富有意义的一种创作。它是基于算法进行创作为数不多的可控参数范围。在加密主义中,也有人把生命游戏带到了区块链上,部署在基于StakNet上,这就将生命游戏的自发行为引入了链上参与者的选择。
菲利普·加兰特认为,复杂主义相当于是演化艺术的核心纲领,是对现代主义艺术和后现代主义艺术的一个超越,跳出了绝对和相对,诉求一种分布式,在过程和循环中追求涌现和共创的精神,注重的是创作过程本身,更注重连接主义等等。
很多研究者认为后现代艺术之后的艺术定义是很荒谬的,艺术不需要定义了。如果从复杂主义来看,其实还是能够有一种新的定义和理解,并且确实是有一种方法论激发艺术家更好地进行创作过程。
复杂艺术:参数、演化与涌现
演化艺术的过程其实非常简单,一个初始的自治系统或者集群系统,有一个原始秩序,最初有一个控制参数进入初始状态,接下来是关键是序参量的调节状态,你创作完之后它就进行自我演化,通过迭代或者互动,可以通过某种干预让其达到混沌边缘状态。在这一边缘状态中,最后产生的结果是最复杂、最丰富的,更可能涌现出新的事物。这种相变的过程是对应性破缺和自组织、强涌现三者共同作用的结果,如果达到强涌现,我们可以扮演上帝的角色了,例如我们真正创造出数字意识就是强涌现的过程。
为什么要混沌之间找到序参量?因为来自物理和自然的规律,在凝聚物理中有一个伊辛模型,对一个铁磁性的物质调节温度,小于某个温度具有铁磁性,大于则是反铁磁性的,温度本身就是序参量,调节温度能够让磁性正或反,或者等于0的时候就是混乱的,磁性消失,这时运动状态最多样。
在演化艺术中,艺术家的创作可以有意识找到序参量控制,或在一定程度上干预过程,即使最后目标的真实系统过于科幻,例如人工意识,那也可以先从这一步先走下去。
1. 如何选取初始集——系统或种群?并考虑哪种对称性破缺和自组织模式?2. 如何选取或设计环境?目前区块链、未来建设的元宇宙是一个前所未有的开放性的数字环境。3. 如何设计交互系统和适应度函数(Fitness)?交互系统是跟5E认知、4E认知、具身嵌入、身份认知相关的东西。4. 控制序参量,使之处于混沌边缘状态。产生最大复杂度的状态,最具创造性和涌现的状态。5.最后观察产生怎样的相变,涌现出了什么新的物态、物种、系统或全新现象?用哪种新复杂性刻画?之后可以应用到新的设计中。
谢谢十三维老师的精彩分享,接下来是讨论环节。邀请到两位嘉宾:中国社科院哲学所科技哲学研究室主任、研究员、博士生导师段伟文老师;媒体艺术家、研究员吴子薇老师,有请两位讨论嘉宾。今天十三维讲的内容涉及到很多生成艺术、演化艺术的技术细节,涉及到艺术和科学,谈科学毫无疑问首先要谈科学概念,是认识论的问题。科学家不会调查所有的形式,哪怕十三维老师举了各种各样艺术实践涉及到的技术类型,尤其是段老师这样的科学哲学家并不会关注和调查所有的现象、形式和主张,但是寻求的是真正重要的问题和概念是什么?有请段老师首先来评论。我印象深的是十三维老师谈到的“创作”,我感觉他把创作作为一种选择,这种选择似乎是回到了最原始的状态,牛顿在海边捡到了贝壳,可能是现代的科学革命或者经典物理学,原始人在海边捡到贝壳可能是作为那个时代的一种财产或者是什么样的东西,有很多有趣的方面可以挖掘。
我最迷惑的地方是,可能有过多的客观性的东西,他把审美跟复杂性的关系去度量,当然可以说当参数是1.3、1.9的时候大家感到舒服、感觉到压迫。当你用这样一些量去进行测度的时候,其实是在做一个反向选择,完全可以说测出1.9很舒服,那么可以说1.3的时候很难受。
说的简单一点,就是一种穿凿附会,当然艺术本身也是穿凿附会。从这样的角度来讲,你讲的是一种“伪科学”,而伪科学恰好是艺术,如果艺术要讲科学就完蛋了,这就是一个穿凿附会,就像我们古代讲的阴阳八卦。就算是搞出一个很难看的东西,依然可以说那个东西有很多人买,那个东西卖了几个亿。说白了,伪科学就是骗傻子的,艺术当然不能说是骗傻子的,但也不能说是理性的。我也看到有有很多生物设计,有很多非常有趣的东西。谈到人工智能艺术或者是生成式的AI,很多AI是通过数据进行分析的AI,现在也出现了生成性的AI、人工智能绘画等等,从技术角度可以把很多东西混在一块。我觉得复杂性不用这样,完全可以把各种图像、雕塑放在一个搅拌器里面随便搅拌,再找一把刀砍一个截面,砍一刀下去,砍到什么就是什么。砍完以后,也可以穿凿附会,说符合阴阳五行、符合道家,完全可以符合。我们谈到艺术,如果把它当做技术图像,是可以抽象化,可以随性而为的,不需要完成什么目标。用复杂性去预测气候、预测地震都是非常失败的,在艺术这里是唯一能大获成功的,只要你们忽悠大家相信那个东西是有价值的,就可以了。实际上,技术图像的抽象化就是随心所欲的,可以根据结果进行解释,甚至可以通过解释强加它的艺术性。
我今天看到抽象艺术,有一个特别的想法,因为你这个东西太复杂了,复杂之后还不断地复杂。我想一个什么概念呢?现在人类越活越久,到最后要得阿尔茨海默症(老年痴呆症),人本来就很累,还要再搞复杂性的艺术。因为是客观制造的,客观制造相当于是造物,最后的结果印证了上帝没有死,但是上帝得了阿尔茨海默症。
如果这样一种艺术是上帝在创造世界之前已经设定好了的局,那就是上帝用这个办法让所有人包括他自己也得上阿尔茨海默症。最后,大家都忘了的时候就会觉得这些东西都是似是而非的,都可以说是艺术,甚至创造者的痴呆症的过程本身就是一种艺术。
现在上帝、元宇宙要得到永生,还要NFT,保证永远不能被改变,怎么可能呢?艺术作品是没有改变,但是人呢、上帝呢?最后不是人来看他的艺术创造,上帝看他的创世杰作,而是上帝、人稀里糊涂创造出来的东西还在!但是人没了,上帝傻了。就是这样一个过程。
从审美的角度讲,这个过程是很好玩的,就像我今天的镜头打不开,镜头打不开本身就是对AI生成艺术的反讽,既然打不开,其实什么都可以看到,想看什么就看什么,为什么?只要吃一颗阿片或者是喝点儿酒加点儿咖啡,再找人打你一拳,其实这个艺术创作很简单,可以设计一个机器人,这个机器人每天用各种办法虐待你,虐待之后再去创作,你创作的东西也是非常有意思的;创作的东西又可以反过来吐槽你、挖苦你,或者是让你觉得你自己过上了一个美好生活的状态等等。这种情况下,艺术创作的意义在哪儿?到底为什么要干这个事?除了要证明人最后是没办法想起他创作了什么。
艺术为什么要加密呢?现在信息那么便宜,你还要加密?我有一点不太清楚。实际上很可能是上帝来证明最终上帝不会死,上帝会慢慢的傻掉,上帝会慢慢丧失创造力。他要等到人自身认识到上帝傻了,人怎么办?人只有抛弃这些所谓的艺术,才能够反过来抛弃上帝的阿尔茨海默症的魔咒,才能寻求真正的艺术。真正的艺术是没有艺术的艺术,就像我今天的摄像头是没有镜头的镜头!谢谢!我先不谈演化艺术,回到十三维老师最开始讲到的生成艺术。何为生成艺术?我并不认为生成艺术是数字的,狭义的定为基于计算机数字的艺术,甚至我都不把生成艺术放在一个技术范畴里,如果从技术领域视角去看生成艺术一定跟某种特定的技术有关,我也不这么看。
首先挑战一下关于“生成艺术”的概念?举几个例子为我自己的观点进行辩护。
上图是在法国洞穴当中的旧时期时代雕刻,下面拓出来的简笔就是对称的群图像,不是三维空间的复杂的对称,就是一种二维平移的对称图像,我们今天谈算法,其实这也是一种算法。公元前5000年,土耳其雕像上的图案也是对称的群图像。从旧石器、新石器跳到观念艺术,索尔∙勒维特(Sol lewitta)描述出规则,谁都可以实践,你可以找一个墙壁,墙壁有其自身的环境,按照规则去实践就可以了。
我更想讲的是大家并不熟悉的一个艺术家Cornelius Cardew(1936—1981),他是英国先锋派作曲家,在作品中用到了《大学》第七段的文字——其本乱而末治者,否矣。如果根本是乱的,关注那些细枝末节是不可能的。他把这一段的英文版分成很多行,每一行是一个单词或者两个单词。
我把这件作品的视频版本理解为生成艺术,大家可能不能理解为什么这是生成艺术呢?其实跟索尔∙勒维特一样,也是一个规则,参与的人数不确定,一般是20个人左右比较好,可以理解为是一个表演。
最开始,每个人选择一个音调,这个音调就是你自主选择的那个参数,用这个音调唱第一个单词,要唱八遍,每一遍都是呼吸的长度,能呼吸多久就唱多久。下一句的时候,你可以在空间里随意走动,听别的人唱,选择一个跟刚才不一样的音调唱第二句,第二句唱五遍。再在空间里走动,选择跟刚才同样不一样的音调唱第三句,按照规则来唱。一方面,声音、唱的音色都是自身所决定和选择的,当然也在规则约束的范围之内。Cardew是一个先锋的实验艺术家,对实验艺术有很大的影响。我为什么把他作为生成艺术的案例来反对把生成艺术放在数字艺术和技术范畴,因为我更想要强调生成艺术真正生成的内核是什么,在这个作品里,每个人唱完之后在空间里运动、聆听别人的声音,再选择自己的音调,所以每一次演奏的版本都是不一样的。
什么是生成的核心?只有理解了生成的核心,才会可以去尝试各种各样的变化,如果限定在就是数字艺术,而数字艺术本身是有门槛的,很多艺术家根本迈不过去那个门槛。生成的核心是运动、是变化、是集体的连接。听别人的声音发出自己的声音,形成一个连接的关系——这是政治上的潜力。
毫无疑问,当我们谈生成艺术的时候,必然要跟我们今天艺术的观念、艺术的运动、艺术的实践都要有关联。生成艺术不是孤立的谈,当你把它作为生成艺术去谈的时候,一定是放在艺术脉络里。艺术推进到今天,我们的各种实践、反思、批判、观念、美学思想都要跟它勾连起来,那个是要继承的。
还有一点很关键,也跟段老师的领域有关,人工智能领域当中非常重要的是关于伦理,谈人工智能的时候哲学家往往关注的是人工智能技术带来的伦理问题,这个问题对生成艺术也同样是不可回避的。正如十三维老师分享的内容一样,很多都是人工智能的核心技术,伴随着技术也带来了一系列的伦理问题,不能回避。
我是学纯艺术出身的,袁园老师提的部分观点我是赞同的,因为我也在做一些相关文献的梳理,我也认为生成艺术不只是用计算机做的,生成艺术很明显跟后现代艺术、当代艺术有很多重合。
后现代艺术、当代艺术更多的是跟艺术家概念有关。我在梳理文献时发现,1968年左右,艺术史学家Jack Burnham提出了一些观点,当时不叫生成艺术而是叫“Process Art”(过程艺术),比如波洛克,以及袁园老师说的声音艺术家的作品创作类型,艺术家均更关注于创作的过程,结果相比起来并没那么重要。后期出现了计算机辅助的艺术和设计,比较契合于今天十三维老师主要讲的,属于Computational Generative Art,以计算机为媒介进行的一系列的生成。我在看相关文献时,也注意到Evolutionary Art,有一些观点认为Computational Generative Art和Computational Evolutionary Art是分开的,也就是今天十三维老师说的生成艺术和演化艺术属于两个概念。
我对这两个概念的理解是,先是有了Computational Generative Art,艺术家可以以计算机为媒介来参与设计创作过程。随后设计了一套生成过程之后,再有一个评价系统,就像十三维老师提到的,有一些美学度量的点在,或者类似遗传算法筛选出一个最优选择,再基于筛选后的结果继续生成。这样一面生成、一面度量,基于度量的结果再生成,就形成了比较基础的Evolutionary Art的结构。
我看到的文献是生成艺术在20世纪90年代有一个大的爆发,比如著名的媒体艺术节林茨电子艺术节(Ars Electronica Festival)1993年的主题是Genetic Art-Artificial Life,90年代绝大部分生成艺术是在探讨演化艺术,探讨进化过程。当然这也不止用于艺术,比如遗传算法也用于工业界。
现在进入了全面开花的AI时代,我也是想把问题抛回给十三维老师,对于90年代为爆发点的Computational Generative Art以及 Evolutionary Art已经过了二三十年。现在是更多介入了AI技术,十三维老师对这个跨时代的技术更迭是怎样的想法?
我要澄清一下,我今天的PPT中涉及到很多数字、算法、计算机和AI内容,但最初对生成艺术定义的时候就没有说是数字系统,其实可以用任何系统进行创作,比如自然系统有一个创作能力,我可以利用它,再比如大家都很有能力、很有创造力,可以想办法设定规则把大家组织起来,最后完成一个机械规则创作。这个系统也是一个创作系统,但导致的是艺术家不再是唯一像上帝那样的创作者。
段老师提到遗忘,其实创造某种意义上真是这样。我举两层例子来回应为什么要有遗忘的过程。如果传统艺术创作角度讲,很多艺术家追求一种癫狂的状态,像被缪斯附体,自我意识边界消失,那个状态往往能创作出杰作。
现在我们是怎么看这个过程呢?从神经科学和心理学的角度来看,当理智系统退让时,大脑会进入默认模式网络,这时潜意识中的信息会把个人理性掩盖,艺术家进入漫无目的随意联想的忘我的状态。在这种发散模式下,虽然最终创作出的是艺术家本人的作品,但艺术家本身就在这一过程中退后了。即它不是一个有意识主体的产物。
所谓的主体,很多观念和翻译中都认为意识本身是agent,它本身是身体、整体的代理,而不是全部,既然是代理,只是最后决策者的状态。研究表明,真正的创造可以分成两个过程:发散和逆向注意力恢复。发散让本能、潜意识最大化,而逆向注意力恢复是理智回来并凝结成某种文字的、最后形成媒介的物质或者符号的某种编码形式,这种让别人理解的一个过程,即所谓的创造过程。上面两个过程则分别对应大脑两种模式:默认网络模式和中央执行网络(注意力网络),当然中间还有一个突显网络是负责切换以上两种网络。这就是创造过程中最关键的大脑三种网络模式,可以看到只有在中央执行网络所谓自我才是在场。
忘我让艺术家不作为唯一主体是生成、演化、多主体共创的核心要素,当理智系统在的时候沟通信道限于某种人类文化既有模式或符号,比如我们现在只能视频,用语音,用文字。对动物或者其他的生物,文明之前有很多别的,比如嗅觉渠道;或者有时大家就是觉得有些人不对劲,凭借的是所谓直觉,其实还有其他很多沟通的信道。
当我们把现有的理智退让之后,就容易打破某种过去继承的,可能是西方传统、东方传统或者是艺术史、科学史的某种范式对我的束缚,当艺术家不在场时,就可能会突破这些所谓基于理性自我意识范畴的束缚,这个特点是其实反而导致一个更大的沟通(联想和连接)的能力。
第二点,艺术家退场不让自我意识掌握全局,就不会要求每个演员一定按照某个步骤走。那个步骤就像跳舞。如果退让之后,设计一些简单规则让其自己发挥,那个时候我跟袁园老师的意见就完全一致了。那位艺术家其实也是把编码写好了,但是在具体做的时候让他们去做,没有决定性的判决让他怎么做,这个过程中其实是有了编码的过程,有了主体发挥的过程,只是这个“主体”是后面要加重探讨的。我们现在研究蚁群、蜂群甚至对于人类集体属性的研究,都是把人削成一个平均的人。如果考虑每个有个性的人的想法、意识形态、智能,会发现这是大规模意志性的agent的协作、集群系统,会产生更加不可思议复杂性的一种涌现的结果。我和袁园老师在这一点上的观点是一致的,只是我讲例子的时候,因为计算机系统是第一次让人知道通过一个编码能够控制外部行为的过程,所以采用其作为主要例子。其实它跟控制论是同时期产生的。
在我看来,控制论的艺术、装置艺术的核心是基于某种信息跟物质系统的作用才能产生所谓的正反可以循环、人机互动、装置之间互动的系统。进一步,我把信息纯粹抽象为一个图灵机,理论上就能够处理更多信息,有更多的结果。通过我们感官接收器感知,以及执行器再去作用外部物质系统,做了一个出力的动作,本质没有变,最后的数字可以传回对现实的作用的。简单说,比如3D打印、数字孪生走的就是这个方向。
因此,生成艺术绝对不仅仅是基于数字系统。无论是自然系统、社会系统、生物系统、生态系统都可以在这个概念中,通过生成和演化视角理解甚至设计。
再回应一下段老师,为什么要有加密?本质上还是为了定位。现实物理系统中有一缺点,物理空间是一个模拟信号世界,维度非常复杂,很难快速把一个东西标识和定位,加密艺术本身做了这种映射,在这种映射的情况下能很快定位并进行智能合约交互。如果做好数字孪生和元宇宙,把物理世界的映射做成,就能够连接更大的系统,无论是设计、科研、做艺术等等,这就是加密艺术近些年不断发展的一个原因。我们第一轮把关于“生成艺术”的概念打开了,第二轮聚焦在“演化”的概念上。
何为演化?演化的理论思想也是分岔的,是达尔文主义的演化还是反达尔文的,还是新达尔文?还是复杂网状演化?到底是哪种演化?对于演化的理解不一样,再理解演化艺术的时候,思想和启发就完全不一样。关于现在的“演化”,中国人更熟悉用“进化”一词,只有生物学家讨论演化的时代早就过去了。更普遍意义上,所有的事物都是演化的过程,当下是演化的结果,同时也处在演化过程当中。各个领域,不仅是我们讲的自然科学、文化领域,都在跨学科的讨论和思考演化的问题。段老师第一轮时反驳的内容,我再多说两句。视觉愉悦和艺术是两回事,尤其和当代艺术是两回事,甚至当代艺术很大程度上不是为了视觉愉悦,甚至是让你视觉难受的,所谓生成一个让我感觉到视觉愉悦的东西不是当代艺术思考的问题,这是很重要的一点。
另外一点,我反过头来说,尽管我们认为在想象力方面的审美有着极大的丰富性,但事实并非如此。进化对人的美学、视觉上有着我们自己都没有想到的影响,我们不要认为艺术、审美视觉愉悦是完全自由的,很大程度上也受演化的影响。
怎样讲呢?我们觉得一个东西好看,你觉得舒服,其实是演化的遗产左右着你,你觉得看着对称的舒服,不对称的看着难受。即便回到艺术史,艺术风格不仅受文化约束,同时也受生物学意义上演化的约束。
为什么会把一个事物迅速辨识出来是文化上的符号?可能我们的祖先在非洲大陆跑的时候就要赶快辨认出来事物,否则可能就会被吃掉了。辨认就是一个反应,拍手还是跑只是反应的不同类型而已,前提是辩认出是个什么东西。审美并不是完全自由的,也并不是单纯由文化决定的,也受生物方面、演化方面的约束。十三维老师举的很多例子能够看到这一点。
视觉艺术有几种阶段:一是所谓风格有明显线性序列变化的,比如文艺复兴、巴洛克等;二是振荡序列阶段,从古典到巴洛克模式不断交替振荡;现在更多受生活文化影响,像一个拱形的发展阶段。
为什么艺术史上会形成视觉阶段?实际上是受演化方面的影响,包括递归、分形、平衡、透视,不仅在视觉艺术里,音乐里所谓的赋格、音节、音调都是那种美学,这个意义上都是生物意义上的演化、平衡、秩序。即便是今天极为多样的当代艺术,仍然在受所谓演化遗产的左右。这里要区分的是什么呢?当代艺术可能比较少受这种演化方面的影响,大众文化、大众的视觉愉悦更受演化层面的影响。
借着这一点,我把问题抛给段老师,您怎么看所谓的演化艺术、生成艺术和“演化”概念之间的关系?我分享一张金吾伦老师《生成哲学》里的一张图片,共同讨论一下。
金吾伦先生是从物理学哲学和自组织理论等出发,其实就是从麦克斯韦妖得到启发,麦克斯韦妖相当于是自然的一种随机偶然的形式,今天讲生成艺术,我的理解是,艺术就像卡尔维诺的《文学机器》里讲的,生成艺术其实就是艺术机器。
卡尔维诺看来,19世纪的文学家为什么可以有大段的心理描述,到了20世纪特别是50年代以后没有了,因为大家认为人的大脑变成输入输出的信息系统,这本来是技术上的偶然发现,但这个发现变成对自我的认定,我们认为我们的大脑就是输入输出系统,哪儿还有什么大段的心理描写呢?就没有《追忆似水年华》里描写的东西了。
如果生成艺术按照科学的理解、客观理解,就有点儿类似于麦克斯韦妖随机偶然性的选择,哈肯妖的目的的趋向性,这么多的agents为什么趋向一个目标。拉普拉斯妖是最早的因果决定论。
金吾伦讲到了一个“生成突创性”,如果说艺术真的有什么价值,在自然之中能够产生什么样的艺术作品?一种什么样的艺术吸引?我觉得我们既不能想象成是好看的,也不想象成不好看的,而想象成是刚好在那个时候能够让你有所感受的,能够打动你的一个东西。能够打动你的那样一个东西,可能就和自然界生成的突创性(创生性)有点儿不太一样,因为那样一个打动要有一种情感共鸣和感应。
这种情况下,十三维老师今天谈到的图灵生成艺术,相当于生成式的AI艺术创作,好像可以对应一种新的妖——图灵妖。
图灵妖能够干什么呢?能够成为所谓的自动机制,变成艺术的自动机。艺术的自动机能够进行一种自我审查和评判,因为生成过程是非常复杂的,可以产生各种各样的东西,有点儿像摇奖,搞一个大转盘在那儿转,转着转着喊停,什么时候停也相当于一种创作;再假设很多人在随机涂鸦,突然喊一下停,就那一下子成为一件作品或者成为一个什么东西。
我理解十三维老师的意思是现在像后人类的时代,艺术创作者不完全是人,是一个agent。在人和机器的共生协同状态中,我的理解是共同发挥作用,但十三维老师会认为艺术家要退到后面去。在我看来,可能会有更好的协同,找到更巧妙的方法。比如一个艺术生成机器在旋转的时候,一个盲人也可以来创作,他看不到里面的东西,只能听到某种声音,从盲人的角度艺术可以超越视觉,在非视觉的情况下,产生了一些新的审查器和评判器。在麦克斯韦妖里是寻找偶然性;协同学里面是寻找目的性;在拉普拉斯妖里面寻找因果决定性;金吾伦讲生成性;图灵艺术是去寻找艺术性。艺术性是一种自我指称、自我兑现的东西,谁能够灵光一现,产生一个时代的人所追捧的艺术性,类似酿酒秘方一样的东西。但是秘方本身也在自动化,所以图灵艺术在有一个无限倒退的问题。在艺术性里寻找具有生命力的艺术作品,因为有一些艺术作品只是流行一时,有一些东西会持续流行,有一些东西能够在若干年以后成为一个杰作。我的问题是,生成艺术一边扮演着艺术家,一边又扮演着鉴赏家、评判家,怎样协调这样一个关系,甚至还有更高层次的,不断地往后退。总的来说,如果没有人的参与这个东西怎么实现?如果有人参与是比较好办的。
实际上,我们的很多情感和欲望并不是自身想要的,有的时候是被时代带动着的,艺术有的时候给我们带来希望,有的时候是让我们对世俗权利的敷衍甚至是吹捧,有的是假艺术之名,有各种各样的东西。最奇怪的是,很多东西的初衷不一定是好的,但真的留下了具有震撼力的作品。从这样的角度讲,有很多东西不完全是演化也不完全是伦理和价值,可能是一种断裂性的事件,能不能成功,取决于能不能打动人,不取决于究竟有多么复杂,是怎样能够自组织等。谢谢段老师,讲的非常好,我接着段老师刚才的内容把问题进一步深入。十三维老师最开始分享的很多案例,无论是视觉让我们觉得愉悦还是觉得像什么,这里其实有一个很大的误区,那个视觉其实不是眼睛看到的,而是大脑创造出来的,我们从来都是创造者,人从来都是创造者,视觉其实是内在视觉。
我们人类眼睛的视神经在视网膜之前,视神经跟大脑连接的时候必然要穿过视网膜,视网膜有一块是没有的;而章鱼的视神经在视网膜之后,视网膜上没有盲点,人的眼睛视网膜上有盲点。有一个很经典的盲点测试:闭上左眼,用右眼盯着十字,身体慢慢地远离屏幕,黑色圆点将会消失;同样的道理,仍然闭着左眼用右眼盯着十字,身体慢慢地远离屏幕,黑色圆点消失之后,中间不是空的,人会自动把这条直线补上,变成一条连续的横线。大脑创造出了一个不存在的图像,这只是一个简单的盲点。你以为人的大脑仅仅是把盲点补上吗?并不是。实际上是大脑创造了我们看到的,而不是被动去接收视觉决定我们看到了什么。
大脑有一系列的演化过程,有生物层面也有文化层面,所谓的颜色、形状、运动、三维空间等等都是大脑的创造,所以我们不要认为视觉是一个客观的视觉。在漫长的进化过程当中,我们的大脑就像一个魔术师创造出了我们所看到的东西,我们在文化层面识别出来这是一个什么东西、什么形象,是抽象的、具象的,什么样的符号,其实都是已然在大脑当中登记注册的视觉的理解。刚才段老师讲到有一点特别好,盲人呢?让-巴蒂斯特·勒尼奥《绘画的起源:狄普塔丝勾勒牧羊人的肖像》,1786年这幅《绘画的起源》画的是恋人要离开她了,烛光把恋人投影在墙壁上,女孩在墙壁上画出恋人的轮廓。她在画的时候,有看她的恋人吗?没有!实际上她凭着记忆在画,哪怕你现在对着镜子画自画像,你绘画的时候眼睛其实也是离开了镜中的自己,是大脑魔术师创造出来的图像决定你画的是什么。
吊诡的地方在哪儿?真正的视觉是大脑创造出来的,大量的视觉图像,我姑且称之为生成艺术或者演化艺术,实际上生成的是表象的视觉,并没有真正care大脑创造出来的图像,仅仅是重现大脑已然创造出来的,说白了就是一个幻觉,复制的是大脑的幻觉机制。换句话说,我们的视觉就是大脑制造出来的幻觉!
荷兰艺术家组合Driessens & Verstappen 2019年的作品《幻想性视错觉》(Pareidolia),这是件加密艺术,看一个视频就知道是怎么一回事了。
艺术家认为世界上所有的人应该都能够在沙子里头找到他的面孔,沙子平铺在转盘上,用一个面部识别软件来识别沙子里头藏的面孔,识别出来后就把图像拎出来,艺术家把大家觉得最像的前100个上架到Opnesea。这件作品涉及到了机械装置,有光学装置、面部检测软件,面部检测软件就是去模仿人的那套视幻觉机制,在沙子里头找出人脸,同时也用到了AI、人工神经网络。
对照艺术家王思顺的作品《启示》,他在过去的七八年一直在世界各地找具有人的面部肖像特征的石头,当然不是那么具象,这就是一种幻想性视错觉,实际上人的所有视觉都是幻想性视错觉。
从这个意义上,我们讨论生成的时候谈真正的演化,如果生成艺术、演化艺术还停留在没有意识到视觉是大脑大脑制造出来的视错觉。当然,我们只是把刚才那种例子称之为视错觉,日常不称为视错觉,但根本上都是这样一个机制。机制里有演化决定的,也有文化决定的。
谢谢袁园老师。我既然是搞艺术实践出身的,那我就分享我自己之前的一个作品,我们可以讨论一下。作品的名字叫Mimicry(拟态),用的就是遗传算法,这个作品做完之后,我和合作者一起写了一个paper发表在计算机的顶刊SIGGRAPH Ar Program。这个paper的名字跟今天讨论的主题很相关,Mimicry:Genetic-algorithm-based Real-time System of Virtual Insects in a Living Envionment-A New and Altered Nature。简单跟大家讲一下我的作品,这个作品的灵感来源于拟态——自然界中的生物通过改变自己身体的图案和形状适应环境的现象。其实不只是在生物学,在传播学里面也有一个拟态环境,英文叫做Pseudo-environment,这是我更深层的灵感来源,pseudo是假的意思。拟态环境是李普曼在《公众舆论》(Public Opinion)这本书里面提到的概念。他说:“每一个人的拟态环境都是一种主观的,有偏见的象征性现实。”它和真实的环境构成的是一个完全闭环的系统,我简单讲一下真实环境和拟态环境的关系。在真实环境中发生了一个事情,新闻会对这个事情进行报道,新闻的报道一定是有节选的,不一定是纯客观的现实,这就可以理解为一个简单的(传播学中的)拟态环境,人对拟态环境进行一个反馈,这个反馈又造成了一系列的后果,后果又直接作用于真实环境的,所以是一个完全闭环的系统。
基于这个闭环系统,我们设计了一个计算机的模拟系统:在真实环境里选了一些花卉,拟态环境对应的是摄像头实时捕捉的部分现实花卉的图像,并将图像发到显示屏的背景里。
Behavior response对应的是在屏幕里的虚拟昆虫,每一个虚拟昆虫自身都有颜色和图案的变化,我们也把一个大的昆虫作为整体,投影在真实环境的花卉上,这样就会有持续变化的反馈。我们自己制作的系统跟拟态环境一一对应,后面说到一些算法的问题,具体的问题我是跟计算机领域比较厉害的小伙伴(黄令东)合作的。
我可以大概解释一下我理解中的算法,我们这个系统是在Html5上运行的,用的是遗传算法,这是(中间的模型Render)一个测试模型,左边是模型上的贴图,因为测试模型上层的背景是白色的,所以这部分模型也主要是白色的,中间是蓝色的,下面主要是红色的,根据背景的颜色进行实时的变化。变化过程不是一次成功的,就像十三维老师说的,有一个变化和纠错的过程。在变化的基础上,我们会选择一个best render,基于best render之后再进行多次迭代。
上面这张图就是阶段性的效果,昆虫刚刚进入这个虚拟环境大概是左图的样子,身上的颜色是比较随机的;经过30分钟的学习,可以看到右图昆虫的颜色跟周围的环境已经很相似了,达到了拟态的效果,这个过程用到了遗传学算法进行贴图计算。
这是一个示意图,我们把虚拟的蚂蚱放到背景图里面,左边的蚂蚱和背景图差异很大,很容易被识别出来,是一个不好的拟态;右边的蚂蚱跟背景很像,所以是一个好的拟态。我们主要计算的是三维模型上的二维贴图,比如蚂蚱身上的花纹。
这张图大概就是作品展览的样貌,有真实的花卉,也有屏幕藏在花丛中,虚拟昆虫是摄像头拍进来的,摄像头捕捉的背景一直在学习。这个布展方式也是致敬白南准之前的作品《电视花园》(TV Garden),他大概在五十年前就探讨自然和科技在未来是否会融为一体。五十年之后的今天,我们觉得自然和科技早就是一体了,所以希望结合虚拟的昆虫于其中,是对白南准作品跨维度的对话。大概是这个样子,我用我自己的作品对今天的主题进行一个回应。谢谢子薇,自然界里的拟态是一个生存策略,你用这个创造的作品,背后关联的是遗传算法。当我们谈遗传的时候,在进化意义上基因是垂直转移的。但是,如果是从另外的视角,复杂网络的网状进化可能会有基因的水平转移,会跨物种转移。
现在看人类本身,其实不是纯种的人类,人类物种的边界只不过是我们在认识论层面非要维系的,其实那个边界早就坍塌了,本身就是跨物种的混合,即便是肉身层面的人类已然也是一个跨物种的混合,生命的形态经过了若干进程当中的动态分配。
当我们说遗传的时候,是在树状进化脉络上垂直的遗传算法?还是所谓复杂的、网状的,可以水平转移的?甚至是植物、动物、微生物都可以转移基因的信息的,这是一个什么样的概念?如果用艺术史里的概念,人本身就是巴洛克式的存在,各种纠缠在一起。
十三维分享遗传算法的时候还在单一种群范围内谈遗传算法。那多种群遗传算法呢?基因水平转移的遗传算法呢?复杂网络进化的遗传算法呢?我把这个问题抛给十三维老师。袁园老师比我讲的更先锋一步,我在演讲中已经隐含和提到一些了。首先回应段老师说的“艺术家的位置”这个问题。我可能过于强调创造系统自己能形成自己的审美度量,自己作为一个选择者或者能够适应环境,其实在这个过程中人类也没有退后,一方面创造的系统或者图灵艺术家是从人类接收了很多审美和价值观。但一方面共生系统之后,创造系统本身会和人类进行交流。
如果从技术哲学角度讲,技术物、AI某种程度上越来越像人,人类如果把自我意识稍微退后一点,我们比较熟悉的赛博格主义,或者是数字人文、数字人类,其实也是会把人类向后退一步,不再是以人文主义的人类为主体,这个时候人类是后人类,人和手机就是和后人类结合体,跟AI或者是其他的技术系统结合,就比原来狭义的人类要更广阔同时又更去自我中心化的位置。即使在这个位置上,人类依然在,人的审美价值不仅在,而且是持续跟技术物本身共生,通过深度网络、更精细的传感器能够捕捉到我们不知道的信息,形成的审美或价值可以跟人类交换,最后是一个共生关系。
关于袁园老师讲的视觉,其实跟创造层级有关,现在的数据基本通过人来喂的,是信息处理模拟特征提取,是一个被动的过程。怎么让它有幻觉、有自主性,成为一个自治系统,有自己所谓的大脑,能够以自己的价值和机制处理它,AI领域正在实践。
最近有一个新闻说有一些大模型说了一些“胡话”,用了一种人类不懂的语言符号完成了人类命令的创造过程。有一些技术哲学家或者是评论者认为,这是AI意识觉醒了,因为它有自己的胡话了,或者从复杂系统讲可能产生了一种新的涌现(注:就在今年,已有论文研究表明,ChatGPT具备了心理理论,相当于能够通过9岁人类水平的心理理论测试)
客观地来看,这可能是一个简单的涌现,完全没有到自我意识层级。我们公司或者说很多做AGI的,目标就是模拟人脑,有自己的情感、意识。作为这种自治系统的时候,接收的数据就不是一个被动客观的数据了,包括幻觉、情感冲动和自己的偏好等等的混合物,纯粹基于自己系统的输出。如果有一天机器真的会做梦,有自己的潜意识,并且有自己的意识进行判别,它相当于成为后面说的两种:共生系统、真实系统的创造。子薇最后提到艺术系统和真实系统是非常相似的,或者科学跟艺术也是互通的,我也非常同意这点。袁园老师说,视觉本身是大脑创造的结果,不是信号的反应,从人类文化角度讲它是一个符号化的产物,它是一个再创造的过程。在这个过程中,可以说大脑本身就是艺术家的角色。我们常说眼见为实,所谓的“真实”本身是存疑的,我反而认为艺术跟自然在这个意义上可能就是等价的。我想在回答一下演化的问题,为什么用演化?袁园老师提到进化其实跟演化是同一个词,但进化确实暗含着一种价值观,我们的世界是不断线性、增长的、无限的、向上升的这样一个过程,这就会给人某种幻想,会以人类已有的某种文化价值观当做真理判别一切尺度,这是进化。社会达尔文主义是臭名昭著,或者是优生学都是非常惨重的教学。演化反而成为一种公平性,我只承认不断变化和演化过程,至于谁优谁劣不是我现在说了算,谁说了算呢?
选择者、判别者本身也是在环境中,这个时候是没有一个绝对的方向,确实有一个判别者,结果是根据环境的偶合程度最终决定最后生存或者是呈现的结果,或者是否本身生命个体存在的意义创造过程,因此用演化的方法能够避免单一线性价值决定的问题。
涌现既然是一个全新的事物,就不是现在能够进行预判的,只能说知道这个原理,像准备一些条件,或者是某种促生的角色。像加密艺术一样,多创造一些合约,让更大规模的组织和人,甚至可能很多动物之间互相理解,人类就是跨物种的,最后回到袁园老师前面说的跨物种交换。跨物种交换是不同物种之间通过DNA、细胞层的协作,即所谓基因水平转移。加密艺术是通过数字方式作为一个定位之后达成类似的效果,例如各种公链生态都兼容以太坊,那么一个链的NFT就能转移到另外一个链上。因此,演化艺术下一步不仅仅是多个主体,而是各种类型、异质性的主体之间,是各种生态之间的交互,这是演化包括艺术的终极形式。因为时间的关系,我借着主持人的特权做一个总结,我们今天是把问题打开,而不是关闭。回到十三维老师讲的“演化”概念,上一轮讲的是,大脑不是被动的接收视觉,而是创造了我们看到的是什么,更进一步来说,大脑构造了这个世界。这个构造又受所谓进化层面或者是演化层面的约束,也受文化层面的约束,决定了我们可能是不一样的人,但是构造出了类似的世界。关于多主体,我不太赞成这个概念。为什么?因为事实上,即便在生物学层面,人类基因组里8%都是病毒基因,在分子层面人根本是内爆的,不存在纯洁的人类边界,在分子层面早就跨物种了,只不过没有这么认识而已;在更大的行星层面,完全是无知、未知、黑暗的。
但是在我们自身的层面呢?我们所处的社会就像大脑一样,从智人到今天的我们,这个演化很大程度上是运气。我们的大脑皮层是非连续性的,很多更有适应性的物种是连续性的,我们并不是最优的一个物种,能活到今天成为高智慧的生物有很多运气成分。我也反对用进化这个概念,因为进化代表一种必然性,可能运气的成分远远超过必然性的解释。
另外,今天讲到很多跟算法有关,我想说算法从来不是客观的,大脑都是构造出来的,算法是人写的。算法本身的模型、函数、参数,无论是逻辑的推理、经验的预设都不是客观的,都携带着进化的约束,携带着文化的约束,包装成了一个客观的模型。对模型本身也要警惕,算法模型从来不是客观的。
我再举一个例子,荷兰艺术家的作品《形态》(morphoteque #8),麦当劳用的土豆都是筛选过的,都是符合标准模型的,而这些就是那些不符合模型,被筛掉的土豆,以及被筛掉的胡萝卜和辣椒,建模的过程本身就是包含着筛选的,已然是一个偏见的模型,加入的各种函数和参数也是偏见的函数和参数,积累的数据集也是如此,这是很关键的。
不要觉得今天讲的生成艺术、演化艺术是多么高科技的,左边是艺术家的作品,右边是我拍的我们家。艺术家把冰柜里的冰柱拿出来,这就是生成艺术,你翻开你们家的冰柜也有生成艺术。我们家的一个墙角也永远会有霉斑,无论我再怎么刷,隔一段时间又长出来不同形态的霉斑,这就是生成艺术,所以生成艺术是特别日常的概念,生成和演化都在日常生活当中,不是在计算机的黑盒子里。
非常感谢三位嘉宾包括十三维老师的分享,感谢今天参与直播的观众。
服务器艺术以服务人类的智慧与知识生产为宗旨,汇聚艺术与科学、哲学人文各学科领域的精英人脉,打造一个理性思想与感性经验交互碰撞、沟通和融合的跨界空间,以此探讨并追究艺术、科学、哲学对于人类存在的意义。服务器艺术基金会将承载一个跨学科、多媒体的交流平台“呼吸公社”,定期举办跨领域的学术对话、讲座、论坛,以闭门与公开、线上与线下等各种交流传播形式,不断拓展并突破现代社会的知识视界和思想疆域。同时服务器艺术立足于艺术的当代性、国际性和原创性,致力于探究全球语境下当代艺术的精神内涵和价值取向,并以收藏、研究优秀当代艺术作品的新型模式,推动中国当代艺术在人类知识基因、文化根性和历史文脉上的不断建构和发展。